遥控器的日益普及的普及程度增加了对追踪人类姿势的高度准确的计算机视觉模型的需求。但是,最好的方法仍然失败,在许多真实的健身场景中,这表明当前数据集和现实世界的健身数据之间存在域间差距。为了使现场能够解决特定于健身的视觉问题,我们创建了InfiniteForm,具有各种健身姿势(15个类别)的60K图像的开源合成数据集,单人和多人场景,以及照明,相机的现实变化角度和闭塞。作为合成数据集,InfiniteForm在身体形状和肤色中提供最小的偏差,并为2D关键点提供标准注释的像素完美标签,以及人类难以或不可能产生像深度和遮挡的标准注释。此外,我们还介绍了一种新的生成过程,用于从预定义的锻炼类别创建不同的合成姿势。该生成过程可以扩展到培训强大的计算机视觉模型所需的任何应用程序。
translated by 谷歌翻译
人体戴的第一人称视觉(FPV)摄像头使从受试者的角度提取有关环境的丰富信息来源。然而,与其他活动环境(例如厨房和室外卧床)相比,基于可穿戴摄像头的eg中心办公室活动的研究进展速度很慢,这主要是由于缺乏足够的数据集来培训更复杂的(例如,深度学习)模型的模型在办公环境中的人类活动识别。本文提供了使用胸部安装的GoPro Hero摄像机,提供了三个地理位置的不同办公室设置中收集的大型公开办公活动数据集(BON):巴塞罗那(西班牙),牛津(英国)和内罗毕(肯尼亚)。 BON数据集包含十八个常见的办公活动,可以将其分为人与人之间的互动(例如与同事聊天),人对象(例如,在白板上写作)和本体感受(例如,步行)。为5秒钟的视频段提供注释。通常,BON包含25个受试者和2639个分段。为了促进子域中的进一步研究,我们还提供了可以用作未来研究基准的结果。
translated by 谷歌翻译
放射线学使用定量医学成像特征来预测临床结果。目前,在新的临床应用中,必须通过启发式试验和纠正过程手动完成各种可用选项的最佳放射组方法。在这项研究中,我们提出了一个框架,以自动优化每个应用程序的放射线工作流程的构建。为此,我们将放射线学作为模块化工作流程,并为每个组件包含大量的常见算法。为了优化每个应用程序的工作流程,我们使用随机搜索和结合使用自动化机器学习。我们在十二个不同的临床应用中评估我们的方法,从而在曲线下导致以下区域:1)脂肪肉瘤(0.83); 2)脱粘型纤维瘤病(0.82); 3)原发性肝肿瘤(0.80); 4)胃肠道肿瘤(0.77); 5)结直肠肝转移(0.61); 6)黑色素瘤转移(0.45); 7)肝细胞癌(0.75); 8)肠系膜纤维化(0.80); 9)前列腺癌(0.72); 10)神经胶质瘤(0.71); 11)阿尔茨海默氏病(0.87);和12)头颈癌(0.84)。我们表明,我们的框架具有比较人类专家的竞争性能,优于放射线基线,并且表现相似或优于贝叶斯优化和更高级的合奏方法。最后,我们的方法完全自动优化了放射线工作流的构建,从而简化了在新应用程序中对放射线生物标志物的搜索。为了促进可重复性和未来的研究,我们公开发布了六个数据集,框架的软件实施以及重现这项研究的代码。
translated by 谷歌翻译
让F:R ^ N - > R是前馈RELU神经网络。众所周知,对于任何选择参数,F是连续和分段(仿射)线性的。我们为有系统调查提供了一些基础,用于系统的架构如何影响其可能的决策区域的几何和拓扑以进行二进制分类任务。在差分拓扑中顺利函数的经典进展之后,我们首先定义通用,横向relu神经网络的概念,并显示几乎所有的Relu网络都是通用的和横向的。然后,我们在F的域中定义了一个部分取向的线性1-复合物,并识别该复合物的属性,从而产生妨碍决策区域的有界连接分量的障碍物。我们使用该阻塞来证明具有单个隐藏的尺寸层(N + 1)的通用横向Relu网络F:R ^ N - > R的决策区域可以不具有多于一个有界连接的组件。
translated by 谷歌翻译